ByteScout PDF Extractor SDK

Software screenshot:
ByteScout PDF Extractor SDK
Software ətraflı:
Version: 9.0.0.3079 Yenil?nib
Tarixi Upload: 15 Aug 18
Geliştirici: ByteScout
Lisenziya: Shareware
Qiymət: 10.00 $
Məşhurluq: 193
Boy: 596 Kb

Rating: 3.3/5 (Total Votes: 4)


        Windows üçün PDF Extractor SDK proqram inkişafçıları: PDF mətn, PDF XML, PDF-dən Şəkillər, PDF məlumat oxumaq, Excel üçün CSV PDF.

Bytescout PDF Extractor SDK mətni mətnə ​​çevirə, XML-lə PDF, CSV-yə PDF-yə çevirir, PDF-lərdən şəkillər çıxarır, tələb olunan hər hansı əlavə proqram olmadan PDF faylları haqqında məlumat çıxarır.


Faydaları:
 PDF-yə düz mətnə ​​çevirir (və bir qəzetin PDF formatında konvertasiya edəcəyi sütunları izləyə bilər) - görünməz mətn çıxarılması daxil olmaqla;
 verilmiş dikdörtgə hüceyrələri oxumaqla Excel-də (CSV) PDF-lə masaları çevirir;
 PDF faylları XML fayllarına çevirir;
 PDF faylı metadatını çıxarır (başlıq, müəllif, təsviri) və fayl haqqında digər məlumatları (səhifələrin sayı, şifrəli və ya);
 PDF sənədindən (ASP.NET, VB.NET, C #, VB6 və VBScript) gömülü şəkillər çıxarır;
 PDF sənədlərini birləşdirmək və bölmək üçün DocumentMerger və DocumentSplitter interfeysləri və dərsləri;
Adobe Reader və ya digər PDF oxucu proqramının yüklənməsini tələb etmir;
 .NET və ActiveX interfeyslərini təmin edir;
 100% idarə edilmiş C # kodu ilə hazırlanmışdır.
    

Bu sürümdə yeni nə :

Sürüm 9.0.0.3079: Şriftin adı, şriftin ölçüsü və rengi ilə çıxarılan məzmunun süzülməsi.
Ən son versiyaya OCR mühərriki yeniləndi. 'Tessdata' qovluğundan dil fayllarını yeniləyin.

Yeni versiyası 8.7.0.2980:

Şriftin adı, şriftin ölçüsü və rengi ilə çıxarılan məzmunun süzülməsi.
Ən son versiyaya OCR mühərriki yeniləndi. 'Tessdata' qovluğundan dil fayllarını yeniləyin.

Yeni versiyası 8.6.0.2911:

Şriftin adı, şriftin ölçüsü və rengi ilə çıxarılan məzmunun süzülməsi.
Ən son versiyaya OCR mühərriki yeniləndi. 'Tessdata' qovluğundan dil fayllarını yeniləyin.

8.2.0.2699 versiyasında

Sürüm 8.2.0.2699, belirtilmemiş güncellemeleri, geliştirmeleri və ya hata düzeltmelerini içerebilir.

Sürüm 8.0.0.2528'de yeni :

  • Şriftin adı, şriftin ölçüsü və rengi ilə çıxarılan məzmunun süzülməsi.
  • Son versiyaya OCR mühərriki yeniləndi. "Tessdata" qovluğundan dil fayllarını yeniləyin.
  • Təkmilləşdirilmiş mətn çıxarılması.
  • Təkmilləşdirilmiş xətlərin cədvəlli məlumatlara qruplaşdırılması.
  • Təkmilləşdirilmiş performans.
  • Təkmilləşdirilmiş XFA formaları çıxarılması.
  • Təkmilləşdirilmiş TableDetector.
  • Sabit PDF təhlil məsələləri.
  • Sabit JBIG images decoding.
  • ImageExtractor: hər səhifədə sabit şəkil çıxarılması.
  • MultimediaExtractor: quraşdırılmış MPEG audio üzərində sabit çıxarma.
  • TextExtractor: sabit işləməyən RemoveHyphenation xüsusiyyət.
  • Digər kiçik inkişaflar və hata düzeltmeleri.
  • Sürüm 7.0.0.2474: yeni nə :

    Sürüm 7.0.0.2474:

    • PDF sənədlərini səssizcə çap etməyə imkan verən yeni DocumentPrinter köməkçi sinfi əlavə etdi (heç bir istifadəçi informasiya qutusu olmadan)
    • yeni JSONExtractor sinfi əlavə etdi
    • Generated fayllar üçün çıxış qovluğunu müəyyən etməyə imkan verən DocumentSplitter.Split () metodu üçün qalıcı əlavə etdi
    • DocumentSplitter-də sabit çox iş parçacıqlı səhv
    • tableDetector indi SetExtractionArea () metodu ilə müəyyən edilmiş ekstraksiya sahəsini hörmət edir
    • Ekstraksiya siniflərində yeni xüsusiyyətlər: ExtractionColumns - aşkarlanan sütunların koordinatlarını ehtiva edir; CustomExtractionColumns - sütunun aşkarlanmasını ləğv etməyə imkan verir
    • GetPageRect * üsulları səhifə rotasiyasını nəzərə almadı.
      Quraşdırmada quraşdırılmış sabit səhv, əvvəlki quraşdırmanın bəzi fayllarına səbəb olub, yeniləmələrə müdaxilə etdi
    • qeydiyyatın yoxlanılmasını reworked. İndi kitabxana bir istisna atmayacaq, ancaq qeydiyyatdan keçmiş və ya yanlış girmiş olsanız, demo rejimində işləyəcək QeydiyyatAdı və QeydiyyatKey
    • PDF Multitool: "PDF sənədini açın" düyməsinə yeni sənədlər əlavə edildi
    • PDF Multitool: Seçim indi yenidən ölçülür
    • PDF Multitool: Added JSON xüsusiyyət çıxarış
    • PDF Multitool: Təkmilləşdirilmiş Cədvəl Dedektörü UI
    • PDF Multitool: Böyük ölçüdə şriftin keyfiyyətini yaxşılaşdırır
    • PDF Multitool: Mövcud səhifənin aşkarlanan sütunlarını görüntüləmək üçün kontekst menyusuna "Həlllənmiş ekstraksiya sütunlarını göstər" variantını əlavə edib. Yalnız görünən səhifəyə qarşı hər hansı bir çıxarma aparıldıqdan sonra görünə bilər
    • PDF Multitool: 32 bit Windows'də Sabit yazı göstərilməsi məsələsi
    • digər kiçik inkişaflar və hata düzeltmelerini

    • Yeni versiyası 6.30.0.2421 :

      Version 6.30.0.2421:

      • TextComparer kommunal sinfi əlavə edildi (yalnız .NET 4.0 iclaslarında mövcuddur), mətni iki sənəddə müqayisə etmək və hesabat yaradır.
      • ICC rəng profillərinin yaxşılaşdırılması.
      • Daxili yazıların idarəsi.
      • Təkmilləşdirilmiş AttachmentExtractor.
      • Sabit XMLExtractor.SaveXMLToStream () metodu.
      • OCRCacheMode.WholePage seçimini istifadə edərkən sabit çıxarılmış mətn çoğaltma.
      • Digər hata düzeltmelerini və təkmilləşdirmələri.

      6.20.2354 sürümünde yeni nə :

      Sürüm 6.20.2354:

      • PDF'ye mətn, PDF CSV, PDF XML funksiyalarına yaxşılaşdırıldı
      • Yeni çıxarış video, Audio nümunələrini çıxarın
      • CSV və XML extractors,
      • içərisindəki boş sütunlu masalar üçün dəstəklənmişdir
      • PDF-dən video və audio çıxarmaq üçün yeni MultimediaExtractor.
      • yeni əmlak PageDataCaching
      • yeni "MemoryCareProcessingOfHugeFiles" Məsələn
      • zaten atılan sayfaları atmaya çalışırken sabit null istisna
      • XLSExtractor: fonts dəstəkini yaxşılaşdırır
      • SkipInvisibleText indi kəsilmiş mətni atır (görünməyən)
      • mətn çıxışının göstərilməsi yaxşılaşdırıldı
      • XFDF Extractor: onay qutuları üçün əlavə dəstək
      • Daha çox alt formatları dəstəkləyən görüntü çıxışı təkmilləşdirilmiş
      • Unicode mətnin işlənməsi təkmilləşdirilmişdir

      • Sürüm 6.11.2149'da yeni :

        Sürüm 6.11.2149:

        • Toplu işləmə nümunələri Reset () metodunun istifadəsini göstərmək üçün yeniləndi
        • Səhifələr çıxarılması üçün əlavə edilmiş C + + source code nümunəsi
        • DocumentMerger 2 faylları birləşdirmək üçün Merge2 (inputfile1, inputfile2, outputfile) metodu əlavə edir
        • XLS Extractor kiçik hata düzeltmelerini
        • PDF Multitool, mətn, şəkil, vektor qatlamlarını aktivləşdirmək / aradan bırakmak üçün imkan verir, mətn çıxarılması üçün inkişaf etmiş parametrləri əlavə edir
        • XML, CSV, Cədvəl çıxarılması sütunların içərisində emtre hüceyrələri olan masalara dəstək verir
        • .ExtractShadowLikeText mülkiyyəti təkmilləşdirilmişdir: kölgəyə bənzəyən mətn üçün daha yaxşı filtrasiya

        Sürüm 6.10.2136'da yeni :

        Sürüm 6.10.2136:

        • XML, PDF, CSV, PDF, mətn funksiyası yaxşılaşmışdır
        • PDF XLS komut satırı nümunəsinə əlavə edildi (vbscript əsasında)
        • PDF üçün HTML SDK əlavə edir .DetectHyperLinks xüsusiyyət (TRUE default olaraq) mətndə avtomatlaşdırılmış əlaqələrin aşkarlanmasını / aradan qaldırılması üçün
        • PDF axtarış PDF fayllarına çevirmək üçün yeni SearchablePDFMaker (PRO lisenziyaları üçün mövcuddur)
        • Extractorda yeni xüsusiyyətlər: ConsiderFontNames, ConsiderFontSizes, ConsiderFontColors, CFG faylları nəzərə alaraqVerticalBorders
        • başlıq sütunların aşkarlanması (AutoAlighHeaderToColumns = true olduğunda) təkmilləşdirilmişdir
        • .DetectLinesInsteadOfParagraphs yeni ilə əvəz edilmişdir .LineGroupingMode xətləri paraqraflar birləşməsi necə nəzarət etmək üçün
        • Vacibdir! PDF PDF mətn obyektləri üçün yanlış Y koordinatı ilə uzun müddət məsələsini düzəldir (yuxarı solun sol altındakı nöqtəyə gəldi)
        • .TableXMinIntersectionRequiredInPercents və .TableYMinIntersectionRequiredInPercents xüsusiyyətləri əlavə edildi
        • C ++ mənbə kodu nümunəsi əlavə edildi
        • XML Extractor PreserveFormatting = true rejimində boş sütunları itirib
        • bəzi PDF fayllarında rənglərdə kiçik düzəlişlər
        • birdən çox OCR dilinə dəstək
        • PDF Multitool GUI: Panoya Kopyala düyməsini TXT, CSV, XML və raster renderer dialoqlarına əlavə edir
        • XLSExtractor: pageToWorksheet özelliğini əlavə səhifədə ayrı-ayrı işlərin yaranmasını / aradan buraxması üçün əlavə edir
        • yeni .TextEncodingCodePage mülkiyyəti
        • PDFViewerControl: istifadəçi xüsusi elementləri kontekst menyusuna əlavə etməyə imkan verən ValidateContextMenu əlavə edir
        • PDF Viewer nəzarət: xüsusiyyətləri əlavə edir ShowTextObjects, ShowImageObjects, ShowVectorObjects
        • XMLExtractor indi tanınan mətn üçün "OCRConfidence" xüsusiyyətini əlavə edir
        • PDF / A yoxlama funksiyası (beta)
        • orijinal susmaya görə nəzarət və mətnin yoxlanılması və hizalanmasının yaxşılaşdırılması. Məsələ həll olunarkən Y koordinatlarının nəzarətdə dəyişikliyə səbəb oldu: bu yanlış idi. Düzgün bir şəkildə ...
        • XML Extractor yeniləndi: artıq onay kutuları və mətn sahələri üçün CONTROL etiketi istehsal edir
        • cari qovluğu temp qovluğuna dəyişdi
        • onay qutuları, radioboxes, editboxes, comboboxes daha yaxşı dəstəklənir
        • indi qismən etibarlı zəng edənlərə imkan verir

        Sürüm 5.80.1781 versiyasında yeni :

        Sürüm 5.80.1781:

        • XML, PDF CSV, PDF mətn funksiyasına yeniləndi
        • OCRMode indi 9 rejimi təmin edir
        • .DetectLineInsteadOfParagraph artıq yaxşı işləyir. Masa hüceyrələrində multiline mətni ələ almaq üçün saxta qoyun!
        • PDF nəzarət dəstəyi təkmilləşdirilmişdir
        • FDF və XFDF məlumatların çıxarılması
        • Sürüm 5.10.1747:

          • XML, PDF CSV, PDF mətn funksiyalarına yaxşılaşdırıldı
          • indi mətn nəzarətindən mətn çıxarmağı dəstəkləyir
          • XML extractor artıq yazı stilini, ölçüsünü, adını, mətn koordinatlarını etiketlərə əlavə edir
          • OCR istifadə üçün ASP.NET nümunəsi əlavə edildi
          • yeni əmlak OCRLanguageDataFolder "tessdata" qovluğunun yerini təyin etmək üçün
          • PDF fayllarının təkmilləşdirilmiş dəstəyi
          • dönmüş mətnə ​​dəstək artırır
          • yenilənən mənbə kod nümunələri
          • yenilənmiş sənədlər
          • kiçik inkişaflar və düzəlişlər

          Yeni versiyası 5.00.1626:

          Sürüm 5.00.1626:

          • OCR (şəkillərdən mətn) funksiyası əlavə edildi: artıq gömülü şəkillərdən mətn çıxarmaq və zədələnmiş mətni təmir edə bilərsiniz
          • CSV və XML extractor ilə bəzi parametrləri olan son sütunları itirməmiş bir məsələ
          • zədələnmiş PDF faylları üçün təkmilləşdirilmiş dəstək
          • Söz axtarış rejimi ilə multiline axtarış mətn axtarışları indi dəstəklənir
          • indi mətnləri tire ilə və fərqli xətlər ilə axtarış edə bilər: yeni mənbə kodunun nümunəsinə bax Ters ilə mətni tapın
          • yeni əmlak .RTLTextAutoDetectionEnabled (avtomatik olaraq RTL dilləri)
          • PDF Viewer GUI demo təkmilləşdirilmişdir
          • kiçik inkişaflar və düzəlişlər
          • Koşullar :

            .NET Framework 2.0 və ya daha yüksək

            Sınırlamalar strong>:

            Naq ekranı, çıxışda su nişanı

    Desteklenen əməliyyat sistemləri

    Oxşar proqram

    Geliştirici digər proqram ByteScout

    Şərh ByteScout PDF Extractor SDK

    Şərhlər tapılmadı
    Şərh əlavə
    Images yandırın!